Claude Codeが音声モードを導入。自然な音声で指示を出せ、キーボード入力から解放され、開発効率が向上。機能は順次展開中で、/voiceコマンドで利用可能。....
声網はメイドゥーなどと共同でAI電話呼び出しの評価基準であるVoiceAgentEvalを発表し、実践性を強調し、6つの分野と30のサブシナリオをカバーしています。この評価基準は実際に使われるビジネスデータを活用し、業界の標準化の発展を促すことを目的としています。
ElevenLabsがマシュー・マコノヒー、マイケル・ケインと音声クローン契約を締結。新プラットフォーム「Iconic Voice Marketplace」でAI声を提供。25人以上の著名人音声を合法ライセンスで利用可能。マコノヒーは投資家としても参画。....
AI音声入力プラットフォームWillow Voiceが420万ドルのエンジェル投資を調達。Y Combinatorなどが投資。自然音声をリアルタイムでテキスト化するツールで、専門用語認識や文法修正機能を搭載。資金は技術強化とクロスプラットフォーム展開に活用。現在macOS版を早期アクセス提供中。....
VoiceDashはAI音声タイピングツールで、音声を迅速に構造化されたテキストに変換し、生産性を向上させます。
Voiceslabは無料で即座にAI音声を作成でき、音色と発音を保持します。
Voiceleyでは、無料で高速にAI音声クローンを行い、音声モデルを使用して音声を生成することができます。
Voicepanelは、AIベースのユーザー調査プラットフォームであり、ユーザーフィードバックを迅速に収集し、深い洞察を提供します。
Google
$0.7
入力トークン/百万
$2.8
出力トークン/百万
1k
コンテキスト長
Anthropic
$7
$35
200
$2.1
$17.5
$21
$105
Alibaba
$3.9
$15.2
64
-
Bytedance
$0.8
$2
128
Deepseek
$4
$12
Tencent
$1
32
Openai
$1.75
$14
400
$525
Chatglm
Iflytek
$0.3
UsefulSensors
Moonshine Tinyは、Moonshine AI(旧有用センサー会社)によって開発された軽量のベトナム語自動音声認識モデルで、たった27Mのパラメータしか持たず、リソース制限のあるプラットフォーム向けに設計されており、FleursとCommon Voice 17のデータセットで優れた性能を発揮します。
webbigdata
VoiceCoreは商用可能な日本語音声AIエージェントモデルで、AIが音声で人間と自然にコミュニケーションすることに特化しており、感情表現と非言語音声の能力を備え、多种類の音声スタイルを選択できます。
Voicevox MCP ServerはVOICEVOX互換の音声合成サーバーで、MCPプロトコルを通じてAivisSpeech/VOICEVOX/COEIROINKとのインタラクションを実現し、CursorなどのエディタでのClaude 3.7代理モードの音声合成をサポートします。
リモートMCPサーバーを統合するためのNode.jsクライアントで、Voiceflowエージェントにツールサポートを提供し、複数のツール探索とClaude AI統合をサポートします。
Voice Modeは、AIアシスタントに自然な音声対話機能を提供するツールで、MCPプロトコルを介してClaude、ChatGPTなどのLLMとの音声対話をサポートします。